---
id: lecture-spark-intro
slug: /lectures/spark
sidebar_position: 1
---

# Spark, менеджеры кластера, Spark и Cubernetis

## План

1. Apache Spark.
2. RDD.
3. Партиции.
4. Операции над RDD.
5. Shuffling.
6. Кешировние.
7. Стейджи.
8. Аккумуляторы.
9. Broadcast variables.
10. Dataframes.
11. Catalyst optimizator.

## Презентация

Презентация доступна по [ссылке](https://hub.mos.ru/iu5bmstu/lections-and-labs/devops/textbook/-/blob/main/src/lectures/spark/presentation.pdf).

## Видеозапись

### 2022

<iframe src="https://vk.com/video_ext.php?oid=-211704031&id=456239102&hd=2" width="100%" height="480" allow="autoplay; encrypted-media; fullscreen; picture-in-picture;" frameborder="0" allowfullscreen></iframe>
